Aller au contenu

 

Découvertes de nouvelles fonctions pour les protéines grâce au serveur CLUSS

Première mondiale pour un programme de bio-informatique

Le responsable du serveur CLUSS, Abdellali Kelil, doctorant en informatique, avec Ryszard Brzezinski, professeur au Département de biologie, et Shengrui Wang, professeur au Département d'informatique.
Le responsable du serveur CLUSS, Abdellali Kelil, doctorant en informatique, avec Ryszard Brzezinski, professeur au Département de biologie, et Shengrui Wang, professeur au Département d'informatique.
Photo : Michel Caron

1 mai 2008

Pierre Masse

Il est 5 h 30 du matin. Alors que les laboratoires de l'Université de Sherbrooke semblent encore déserts, un biologiste de l'Inde se branche sur le serveur CLUSS (Clustering Protein Families) de la Faculté des sciences. Quelques minutes plus tard, il identifie deux séquences de protéines qui pourraient bien avoir une fonction commune sur la prolifération d'une bactérie. À 7 h 05, une chercheuse du Japon teste une hypothèse sur une séquence d'ADN. À 11 h 48, c'est au tour d'un groupe de microbiologistes de l'Université de l'État du Montana de lancer un calcul pour comparer plus de 6000 séquences non alignées de protéines… et la journée ne fait que commencer au laboratoire de prospection de données de l'UdeS (ProspectUS).

Le programme CLUSS, en ligne depuis moins d'un an, permet d'établir des liens entre des séquences non alignées de protéines et les fonctions de ces dernières. D'après l'équipe de ProspectUS, la capacité de CLUSS à évaluer des séquences non alignées est une première mondiale. Cette innovation lui a d'ailleurs valu le Prix du meilleur article lors de la dernière conférence internationale de bio-informatique et de bio-ingénierie en 2007 à Harvard, au Massachusetts.

1000 requêtes par semaine

Abdellali Kelil, doctorant en informatique, surveille le terminal de CLUSS et en améliore continuellement les performances. Dans le journal d'accès au serveur, il relève chaque semaine 20 à 30 chercheurs qui se branchent au programme de bio-informatique depuis des laboratoires répartis partout dans le monde. Il reçoit régulièrement des témoignages de spécialistes en génomique, de microbiologistes, de biologistes et de bio-informaticiens qui soulignent l'apport exceptionnel de cet outil pour faire avancer leurs recherches.

«Au début, il y a moins d'un an, on notait 5 à 10 requêtes par mois. Aujourd'hui, on atteint presque 1000 requêtes par semaine! s'exclame Abdellali Kelil. Les chercheurs se branchent et peuvent choisir parmi trois algorithmes. Après avoir précisé certains paramètres, ils obtiennent le résultat en quelques secondes.» Pour appuyer ses propos, le responsable du programme sort le courriel d'un spécialiste en informatique biomoléculaire basé aux Pays-Bas. Les résultats préliminaires que ce chercheur a obtenus avec CLUSS sont tellement impressionnants qu'il demande maintenant à comparer les séquences de près de 39 000 protéines. «CLUSS n'a pas été programmé pour un si grand nombre de protéines! confie le bio-informaticien. Nous tentons d'améliorer les capacités pour traiter des centaines de milliers de protéines simultanément. Dans quelques mois, avec un bon serveur, on pourra prendre la séquence d'une protéine et la comparer aux six millions de protéines qui pourraient lui ressembler.»

Un outil ultrapuissant de forage de données

Cette pratique non commerciale et ouverte de la bio-informatique est une particularité qu'apprécie le professeur Shengrui Wang, de la Faculté des sciences. Elle l'a poussé récemment à partager avec des biologistes son expertise en forage de données.

Shengrui Wang explique que le forage de données regroupe des méthodes qui permettent de traiter d'immenses quantités de données pour en extraire les informations pertinentes lorsque les méthodes statistiques classiques ne fonctionnent plus. Les travaux de recherche du professeur Wang s'appliquent déjà à de nombreux domaines : la détection du risque de faillite des clients d'institutions bancaires, l'identification automatisée d'experts au sein de forums de discussion sur Internet et l'aide au diagnostic médical de patientes atteintes de cancer des ovaires.

L'informaticien raconte que l'application des méthodes de forage de données à CLUSS surpasse de loin les méthodes classiques. À tel point que le comité de lecture d'une des meilleures revues scientifiques auquel son groupe de recherche a récemment soumis ses résultats a demandé de les vérifier sur d'autres modèles biologiques. «Nous leur avons prouvé que la méthode fonctionne mieux que les façons de faire traditionnelles et de plus, qu'elle fonctionne très bien sur les données non alignées que les méthodes traditionnelles sont absolument incapables de traiter, répond le professeur Wang. Notre laboratoire offre un outil ultrapuissant très apprécié par des biologistes du monde entier.»

Ce succès mondial est le fruit d'une coopération avec le professeur Ryszard Brzezinski, un microbiologiste spécialiste en biotechnologie de la Faculté des sciences. Ce chercheur explique que les biologistes ont rarement le réflexe d'intégrer les bio-informaticiens au sein de leurs équipes. Pourtant, à l'entendre, la bio-informatique permettra de découvrir de nouvelles informations biologiques inaccessibles sans ces outils. «Cette conscience commence à émerger dans plusieurs équipes, comme celles financées par Génome Québec ou Génome Canada, qui doivent traiter de très grandes quantités de données, dit le professeur Brzezinski. Toutefois, ces nouveaux spécialistes hybrides sont encore si rares dans le domaine qu'on se les arrache.»

Les blouses blanches appelées à disparaître?

Pour ses propres travaux de recherche, Ryszard Brzezinski intègre régulièrement l'aspect bio-informatique et se sert d'outils en libre accès comme CLUSS, répartis un peu partout sur la planète. Le rêve d'une science partagée dans le monde entier devient pour lui une réalité. «La bio-informatique a l'esprit sans frontière d'Internet, précise le biologiste. La plupart des chercheurs utilisent des produits gratuits et rendent accessibles leurs algorithmes à toute la communauté scientifique.» Pas étonnant dans ce contexte de voir ses derniers travaux cosignés par des chercheurs venant de trois continents.

Une autre conséquence de l'utilisation de la bio-informatique est la diminution du temps d'expérimentation au profit de celui passé devant l'ordinateur. Toutefois, les blouses blanches ont encore de beaux jours derrière les paillasses des laboratoires. «Leur disparition signifierait que tous les organismes existant sur la planète auraient été définis, ce qui est aussi probable que la téléportation de Star Trek», réplique avec humour le professeur Brzezinski.

En attendant les voyages à vitesse supraluminique, Abdellali Kelil patrouille à pied les couloirs de ProspectUS et répond sur le serveur CLUSS aux missions d'exploration génétique des bio-informaticiens de la planète science…